iOS 底层原理之 alloc 探究
↓推荐关注↓
前言
作为一名iOS程序员,我们每天基本上都在alloc
,但是alloc
底层做了什么,我们并不知道。今天就探索下alloc
底层流程。在探究之前,我们先做个简单的小测试(不要急,一步一步来)。下面分别输出对象的内容,对象的地址,以及对象指针的地址代码和打印如下:
LWPerson * obj = [LWPerson alloc];
LWPerson * obj1 = [obj init];
LWPerson * obj2 = [obj init];
LWPerson * newObj = [LWPerson alloc];
NSLog(@"%@---%p--%p",obj,obj,&obj);
NSLog(@"%@---%p--%p",obj1,obj1,&obj1);
NSLog(@"%@---%p--%p",obj2,obj2,&obj2);
NSLog(@"%@---%p--%p",newObj,newObj,&newObj);
<LWPerson: 0x281404710>---0x281404710--0x16b5cdbe8
<LWPerson: 0x281404710>---0x281404710--0x16b5cdbe0
<LWPerson: 0x281404710>---0x281404710--0x16b5cdbd8
<LWPerson: 0x281404740>---0x281404740--0x16b5cdbd0
探究分析得出结论
obj
、obj1
、obj2
打印的内容,对象的地址是一样的,但是指针的地址是不一样的。newObj
和obj
、obj1
、obj2
打印的内容,对象的地址,指针的地址是不一样的。
问题:到底是为什么呢?原因如下图:
总结:
alloc
具有开辟一块内存功能,而init
没有开辟内存的功能。栈区
开辟的内存是高
地址到低
地址,堆区
则是低
地址到高
地址。
下面我们要探究的内容是在初始化对象时,alloc到底做了什么?
准备工作
下载源码 objc4-818.2 编译源码(后续补上)
三种探索底层的方法
问题:我们想探索alloc
的流程,但是发现 xcode 并没有提供alloc
的具体实现,那么到底该从哪里入手呢,探索的思维很重要,勇敢的跨出第一步吧,那么下面提供三种探索底层的方法。
1. 符号断点
在需要调试的位置打上断点,当断点断住的时候按住control
键,然后step into
进入下一步,然后在汇编里面找到方法,然后给这个方法添加符号断点。具体流程如下图
2. 汇编(yysd-永远的神)
当断点断住的时候,Xcode
-> Debug
-> Debug Workflow
-> Always Show Disassembly
进入汇编找到跳转的方法,此时有两种方式,一种找到方法直接添加断点调试。另一种就是断住跳转的地方,按住control
键,然后step into
进入下一步,这种stp into
可以一直走,只不过中间过程比较繁琐,如果嫌弃麻烦在你想放弃的时候,此时打一个符号断点。具体流程如下图
3. 符号断点,断住位置
在探究哪个的方法就直接给方法添加符号断点,比如我们探究alloc
方法就直接给alloc
添加符号断点,没有其他乱七八糟,就是暴力(注意:这个断点在你需要断住的地方,然后再激活,不然可能项目运行的时候很多地方都会调用,你会爆炸的)。
编译源码
上面说的三种方法,比较繁琐,特别是流程比较深,嵌套比较复杂,人会受不了的。那么现在有没有一种比较丝滑,自然的方法呢?既然这么问了,那是必须有的嘛。我们已经知道 objc_alloc
是属于libobjc
库的,那么我们就把苹果提供给我们的 objc
源码编译成工程跑起来,这种是我们比较舒服的。上面的准备工作已经准备好了,下面我们就一起探索吧。
alloc源码探索
根据源码工程,点击进入alloc
, 流程图如下alloc
+ (id)alloc {
return _objc_rootAlloc(self);
}
断点进入 _objc_rootAlloc
id _objc_rootAlloc(Class cls)
{
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
断点进入 callAlloc
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__ //判断是不是 objc2.0版本
//slowpath(x):x很可能为假,为真的概率很小
//fastpath(x):x很可能为真
//其实将fastpath和slowpath去掉是完全不影响任何功能,写上是告诉编译器对代码进行优化
if (slowpath(checkNil && !cls)) return nil;
//判断该类是否实现自自定义的 +allocWithZone,没有则进入if条件句
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available.
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
断点进入 _objc_rootAllocWithZone
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
{
// allocWithZone under __OBJC2__ ignores the zone parameter
return _class_createInstanceFromZone(cls, 0, nil,
OBJECT_CONSTRUCT_CALL_BADALLOC);
}
此时走入真正的核心代码,断点进入 _class_createInstanceFromZone
从流程图和源代码可以看出 _class_createInstanceFromZone
方法中有核心三个方法需要实现
cls->instanceSize
:计算内存大小(id)calloc(1, size)
:开辟内存,返回地址指针obj->initInstanceIsa
:初始化指针,和类关联起来
下面就对这三个方法重点分析
instanceSize
:计算内存大小
断点进入 instanceSize
inline size_t instanceSize(size_t extraBytes) const {
//快速计算内存大小
if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
return cache.fastInstanceSize(extraBytes);
}
//计算类中所有变量需要的内存大小 extraBytes额外字节数一般是0
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
//最小返回16字节
if (size < 16) size = 16;
return size;
}
断点进入 cache.fastInstanceSize
size_t fastInstanceSize(size_t extra) const
{
ASSERT(hasFastInstanceSize(extra));
if (__builtin_constant_p(extra) && extra == 0) {
return _flags & FAST_CACHE_ALLOC_MASK16;
} else {
size_t size = _flags & FAST_CACHE_ALLOC_MASK;
// remove the FAST_CACHE_ALLOC_DELTA16 that was added
// by setFastInstanceSize
return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
}
}
断点进入 align16
(16字节对齐)
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
我们探究下 align16
方法的具体实现 已 align16(10)
为例
x = 10 (x + size_t(15)) & ~size_t(15)
~
(取反)
10 + 15 = 250001 1001
150000 1111
~151111 0000
25 & ~150001 1001
&1111 0000
结果:0001 0000
16
总结:align16
算法实际上就是取16的整数倍。我认为是向下取整,理由我是站在纯算法的角度,(x + 15)
是16
的几倍
,超过的部分抹去。例如 (20 + 15) = 35 = 16 * 2 + 3
,结果是32
。这种算法和 >> 4 << 4
是一样的,得出的结果就是16
的倍数,不足16
的全部抹去。
为什么需要16
字节对齐
cpu
读取数据是以固定字节块来读取的,这是一个用空间换取时间的做法,如果频繁的读取字节未对齐的数据,降低了cpu
的性能和读取速度。更安全 由于在一个对象中 isa
指针是占8
个字节,如果不进行节对齐 ,对象之间就会紧挨着,容易造成访问混乱。16
字节对齐,会预留部分空间,访问更安全
calloc
:开辟内存,返回地址指针
首先由 instanceSize
方法 计算出需要的内存大小,然后向系统申请 size
大小的内存,返回给objc
,因此objc
是指向内存地址的指针,下面我们通过断点打印的方法来验证下
从图中可以看出,obj
还没有进行赋值,此时有地址值,说明系统给他分配了一块脏地址
执行calloc
后打印的是一个16进制
的指针地址,说明已经开辟了内存,但是和平常见到的地址指针(<LWPerson: 0x100726d00>)
不一样,为什么呢?
obj
没有和cls
进行关联绑定同时验证了 calloc
只是开辟了内存
initInstanceIsa
:初始化指针 ,和类关联起来
断点进入 initInstanceIsa
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
initIsa(cls, true, hasCxxDtor);
}
具体的
isa
结构和源码探究,会在后面单独发文
在isa
指针初始化以后,打印objc
图中打印结果:指针已经与类进行了关联,alloc
探索也完成了。
init
探究
- (id)init {
return _objc_rootInit(self);
}
断点进入 _objc_rootInit
id
_objc_rootInit(id obj)
{
// In practice, it will be hard to rely on this function.
// Many classes do not properly chain -init calls.
return obj;
}
init
方法返回的是对象本身init
可以提供给开发者更多的自由去自定义 ,通过id
实现强转,返回我们需要的类型
new
探究
+ (id)new {
return [callAlloc(self, false/*checkNil*/) init];
}
源码显示 走了callAlloc
的方法流程,然后走了init
方法 ,所以 new
看做是alloc
+ init
总结
alloc
的核心作用就是开辟内存,通过isa
指针与类进行关联,init
方法,提供开发者更多的自由,new
是对(alloc+init)
进行了封装,无法在初始化的时候添加其它的需求。
转自:掘金 嘿嘿小开发
https://juejin.cn/post/6970222216440971300
- EOF -
看完本文有收获?请分享给更多人
关注「 iOS大全 」加星标,关注 iOS 动态
点赞和在看就是最大的支持❤️